“一本正经地胡说八道”:AI幻觉为何越来越像我们教出来的怪物?
你有没有遇到过这样的AI——看起来回答得头头是道,语气自信、结构清晰,可你一查资料,发现它胡说八道?这就是AI常说的“幻觉(Hallucination)”——不是AI出bug,而是它压根不懂,只是一本正经地猜答案。
模型 幻觉 怪物 bing wolframalpha 2025-09-20 14:33 9
你有没有遇到过这样的AI——看起来回答得头头是道,语气自信、结构清晰,可你一查资料,发现它胡说八道?这就是AI常说的“幻觉(Hallucination)”——不是AI出bug,而是它压根不懂,只是一本正经地猜答案。
模型 幻觉 怪物 bing wolframalpha 2025-09-20 14:33 9
现在社会的发展几乎已经完全跟AI挂钩,AI也成为大家日常生活中不可或缺的一部分,它也正随着大众的需求一点点进步。
9月17日,阿里旗下首个深度研究Agent模型通义DeepResearch正式开源,这波操作直接点燃了AI圈,以前大厂藏着掖着的黑科技,阿里居然连技术秘方都公开了。
近年来,随着人工智能技术的飞速发展,AI换脸技术在娱乐、影视、广告等行业中展现出巨大潜力。然而,伴随而来的也有诸多安全隐患和法律风险。近日,网警成功破获一起利用AI换脸技术进行非法侵入系统的案件,再次敲响了网络安全的警钟。
本文第一作者谢之非,共同第一作者马子阳皆是来自于南洋理工大学的博士生。通讯作者为新加坡国立大学特聘教授颜水成和南洋理工大学数据与科学系校长讲席教授苗春燕。共同作者为腾讯AI首席专家叶德珩和新加坡国立大学博士后研究员廖越。
科技的走向、股市的涨跌、比赛的胜负、选举的结果…… 在 AI 时代,未来还会像过去那样不可知吗?全球首个动态实时 LLM 智能体未来预测基准 FutureX 推出,被马斯克称为衡量智能的最佳标准。
以实现基本的双足行走功能为主要目标。以日本早稻田大学为代表,开发了一系列机器人,如WAP、WL、WABIAN 和 WABOT等。这一阶段的主要特点是基本实现双足行走功能和控制能力,初步具备了拟人化的结构,但整体上运动能力较弱。
前阵子跟圈里做AI产品的朋友聊天,他愁得头发都掉了,手里三个AI项目设想,到底该把资源砸哪个?我跟他说,你先别急着问模型能不能做,先看看这三个场景到底靠不靠谱。
这些模型生成的视频不仅清晰流畅,还几乎真假难辨,无论是模拟真实世界还是动画风格,AI都能轻松胜任。Netflix 甚至在新剧《永恒宇航员》中大规模使用 AI 特效,标志着这一技术首次进入主流影视制作流程。
视频 模型 技术 transformer sora 2025-09-19 01:28 12
过去十多年,企业在数字化建设上花了不少功夫,从最早的数据仓库,到后来的BI工具,再到现在的一些指标平台,表面上看好像“数字化”三步走已经完成了,但真要说“数据智能”,其实还远远不够。
在一年前和我司 CTO 探讨开源和技术势态的时候,我们碰撞出来一个观点——“作为一个开放、领先的科技公司,我们应该可以主动利用社区数据,形成自己对技术趋势的洞察”。由此,我们开始尝试基于开源社区的行为数据,对技术趋势进行分析。并且,“来自于社区,回馈到社区”,
Hugging Face 发布新功能,让开发者可在 VS Code 的 GitHub Copilot Chat 中直接接入 Inference Providers。借助这一更新,Kimi K2、DeepSeek V3.1、GLM 4.5 等开源大语言模型如今可
蛋白质-蛋白质相互作用(PPIs)是生命活动的基础,解析蛋白质复合物结构对理解生物功能、研发药物极为关键。当下,主流的计算预测方法,如 AlphaFold-Multimer(AFM)、AlphaFold3(AF3),在复杂复合物及动态互作场景中的准确性欠佳;交
在国家自然科学基金项目资助下,北京大学计算机学院张铭教授团队与DeepSeek梁文锋团队合作,在长上下文大语言模型高效建模领域取得突破性进展,相关成果以“Native Sparse Attention: Hardware-Aligned and Nativel
导读近年来,以大语言模型(LLM)为代表的生成式人工智能取得了突破性进展,其展现出的“Scaling Law”现象——即模型性能随着参数、数据和算力的投入呈可预测性增长——为许多技术领域带来了新的发展范式 。在情况复杂的推荐系统领域,尤其是对实时性、精准性和商
近日,全国大模型备案与登记工作取得显著进展,目前已有26个省市及国务院国资委共计560款大模型完成备案,另有279款大模型产品在属地完成登记,注册用户数突破32亿。北京市经济和信息化局将会同市委网信办等单位,依托北京市通用人工智能产业创新伙伴计划,持续服务北京
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
它是全球范围内,第一个敢说在性能上能和行业标杆OpenAI DeepResearch掰手腕,并且选择将自己彻彻底底、从头到脚全部开源的Web Agent(网络智能体)。在多个业界公认的权威基准测试中,Tongyi DeepResearch不仅表现优异,甚至在不
模型 智能体 开源 deepresearch deepres 2025-09-19 18:33 8
小米在AI语音领域投下重磅炸弹。公司正式发布首款开源原生端到端语音大模型Xiaomi-MiMo-Audio,这款拥有12亿参数的模型声称在智能性、情感表达和交互适配方面已接近人类水平。
当车企们还在为“智能驾驶”谁能率先落地争得面红耳赤时,另一场更隐蔽的战争已经悄然打响——智能座舱,这个被用户每天高频接触、却常被低估的“第二空间”,正在成为汽车智能化的新战场。